Selección de unidades léxicas para reconocimiento automático del habla continua en euskera

نویسندگان

  • Karmele López de Ipiña
  • Manuel Graña
  • Ekaitz Zulueta
  • Aitzol Ezeiza
چکیده

Basque is an agglutinative language, which implies that corpusvocabulary can not be defined with words, because they growcombinationally making medium and large vocabulary tasks intractable. Pseudo-morphemes, generated with an automatic segmentation tool, could be an alternative choice for building the lexicon and the language model, for they notably reduce the vocabulary size. In Basque, there are many short and acoustically very similar morphemes. This phenomenon has to be taken into account, because the acoustic-phonetic decodification proccess can influence the CSR task, increasing the possibility of confussion and insertion of certain lexical units (very short units with high rates of acoustic confussion). A feasible way to deal with this problem is to avoid the segmentation of those units. The next step to improve the CSR system in Basque is the use of a language model in order to guide the recognition proccess.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sistema de reconocimiento multilenguaje del habla

Resumen. Este trabajo se comienza con la presentación de una serie de art́ıculos relacionados con el Reconocimiento Automático del Habla. Se realiza un análisis de cada uno de ellos donde se obtienen datos relevantes y los que serán de gran ayuda para desarrollar la propuesta multilenguaje de un sistema de reconocimiento del habla aqúı descrito. Existen varias técnicas que son aplicadas para log...

متن کامل

Reconocimiento de Voz en Español Mediante Sílabas

ctualmente, el uso de los fonemas tiene implícitas varias dificultades, debido a que la identificación de las fronteras entre ellos por lo regular es difícil de encontrar en representaciones acústicas de voz. El presente trabajo plantea una alternativa a la forma en la que el reconocimiento de voz se ha estado implementando desde hace tiempo, analizando la forma en la cual el paradigma de la sí...

متن کامل

Información colocacional y recuperación de la información

Este proyecto tiene como objetivo investigar la significación de la información colocacional en Recuperación de la información (RI). Una colocación es una relación entre dos unidades léxicas (UL) L1 y L2 tal que para expresar un significado específico en relación con L1 la elección de L2 no es libre (Mel' uk 1995). Así, para expresar el sentido 'hacer lo que está previsto que se debe hacer' en ...

متن کامل

PHILIPS: Intelligent Speech Interpretation - la tecnología inteligente de reconocimiento de voz

Resumen: Independientemente de la aplicación, el núcleo de cualquier sistema de reconocimiento de voz sigue siendo la inteligencia que convierte el habla en texto. Al reconocer lo que se dice e interpretarlo de forma razonable, garantiza una intervención mínima en el proceso de trascripción para producir informes útiles. Palabras clave: Philips, SpeechMagic, reconocimiento del habla, tecnología...

متن کامل

Avivavoz: Tecnologías Para La Traducción De Voz

AVIVAVOZ es un proyecto de tres años dirigido a la investigación avanzada en todas las tecnologías clave que intervienen en un sistema de traducción de voz (reconocimiento, traducción y síntesis de voz). El objetivo del proyecto es lograr avances reales en todos los componentes de un sistema de traducción de voz para alcanzar sistemas de intermediación oral entre personas en las lenguas oficial...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 31  شماره 

صفحات  -

تاریخ انتشار 2003